12 research outputs found

    A Bloom filter based semi-index on qq-grams

    Full text link
    We present a simple qq-gram based semi-index, which allows to look for a pattern typically only in a small fraction of text blocks. Several space-time tradeoffs are presented. Experiments on Pizza & Chili datasets show that our solution is up to three orders of magnitude faster than the Claude et al. \cite{CNPSTjda10} semi-index at a comparable space usage

    Optimization of Magnetic Field-Assisted Synthesis of Carbon Nanotubes for Sensing Applications

    Get PDF
    One of the most effective ways of synthesizing carbon nanotubes is the arc discharge method. This paper describes a system supported by a magnetic field which can be generated by an external coil. An electric arc between two electrodes is stabilized by the magnetic field following mass flux stabilization from the anode to the cathode. In this work four constructions are compared. Different configurations of cathode and coils are calculated and presented. Exemplary results are discussed. The paper describes attempts of magnetic field optimization for different configurations of electrodes

    Data classification, data set reduction and editing algorithms using the representative measure

    No full text
    Klasyfikacja danych to podejmowanie decyzji na podstawie informacji, kt贸re te dane przenosz膮 (tzw. cech danych). Prawid艂owa i szybka klasyfikacja zale偶y od prawid艂owego przygotowania zbioru danych, jak i doboru odpowiedniego algorytmu klasyfikacji. Jednym z takich algorytm贸w jest popularny algorytm najbli偶szego s膮siada (NN). Jego zaletami s膮 prostota, intuicyjno艣膰 i szerokie spektrum zastosowa艅. Jego wad膮 s膮 du偶e wymagania pami臋ciowe i spadek szybko艣ci dzia艂ania dla ogromnych zbior贸w danych. Algorytmy redukcji usuwaj膮 znaczn膮 cz臋艣膰 element贸w ze zbioru danych, co znacz膮co przyspiesza dzia艂anie algorytmu NN, jednocze艣nie pozostawiaj膮c te, na podstawie kt贸rych nadal mo偶na z zadawalaj膮c膮 jako艣ci膮 klasyfikowa膰 dane. Algorytmy edycji oczyszczaj膮 zbi贸r danych z nadmiarowych i b艂臋dnych element贸w. W artykule zaprezentowane zostan膮 algorytm redukcji i algorytm edycji zbior贸w danych, obydwa wykorzystuj膮ce miar臋 reprezentatywno艣ci. Testy przeprowadzono na kilku dobrze znanych w literaturze zbiorach danych r贸偶nej wielko艣ci. Otrzymane wyniki s膮 obiecuj膮ce. Zestawiono je z wynikami innych popularnych algorytm贸w redukcji i edycji.In data classification we make decision based on data features. Proper and fast classification depends on a Preparation of a data set and a selection of a suitable classification algorithm. One of these algorithms is popular Nearest Neighbor Rule (NN). Its advantages are simplicity, intuitiveness and wide rang臋 of applications. Its disadvantages are large memory requirements and decrease in speed for large data sets. Reduction algorithms remove much of data, which significantly speeds up NN. Simultaneously, they leave that data on the basis of which we can still make decisions with an acceptable classification quality. Editing algorithms remove redundant and atypical data from a data set. In this paper new reduction and editing algorithms, both using the representative measure, are presented. Tests were performed on several well-known in the literature data sets of different sizes. The results are promising. They were compared with the results of other popular reduction and editing procedures

    Stratna kompresja obrazu z wykorzystaniem aproksymacji liniowej

    No full text
    Tyt. z nag艂贸wka.Bibliogr. s. 470.Dost臋pny r贸wnie偶 w formie drukowanej.STRESZCZENIE: Artyku艂 przedstawia algorytm stratnej kompresji obrazu z wykorzystaniem aproksymacji liniowej. Om贸wione s膮 wyniki kompresji przyk艂adowych bitmap. Sformu艂owane s膮 r贸wnie偶 wnioski na temat przydatno艣ci tego algorytmu dla pewnego rodzaju obraz贸w. S艁OWA KLUCZOWE: stratna kompresja obrazu, aproksymacja liniowa, JPEG, GIF, PNG, ZIP. ABSTRACT: In this paper lossy image compression algorithm has been presented. The algorithm uses linear approximation. The article discusses the compression result of example bitmaps. The conclusions of the usefulness of the algorithm for some kind of pictures has been discussed. KEYWORDS: lossy image compression, linear approximation, JPEG, GIF, PNG, ZIP

    Review of algorithmic and engineering problems in a computer-aided translation application handling multi-language DTP documents

    No full text
    Praca przedstawia szereg zagadnie艅 zwi膮zanych z automatycznym t艂umaczeniem katalog贸w i broszur reklamowych przy u偶yciu systemu klasy CAT (Computer-Aided Translation) i dokumentuje nasze prace zwi膮zane z otrzymaniem efektywnych rozwi膮za艅 algorytmicznych. Programy CAT zwykle dzia艂aj膮 na poziomie ma艂ych segment贸w tekstu (fraz), zorganizowanych w postaci s艂ownik贸w (ang. Translation Memory). Programy CAT umo偶liwiaj膮 m.in. swobodn膮 nawigacj臋 po dokumencie, automatyczne t艂umaczenie rozpoznanych fraz i sugestie t艂umaczenia dla fraz podobnych do ju偶 istniej膮cych w systemie, wygodne wyszukiwanie i edycj臋 s艂ownik贸w. Og贸lnie bior膮c rozwa偶ane przez nas zagadnienia mo偶na podzieli膰 na: dotycz膮ce interfejsu u偶ytkownika oraz dotycz膮ce algorytm贸w tekstowych. W szczeg贸lno艣ci rozwi膮zali艣my zagadnienia detekcji symboli (tj. sekwencji znak贸w nie wymagaj膮cych t艂umaczenia dla wi臋kszo艣ci par j臋zykowych takich jak liczby, jednostki fizyczne, kody, numery fabryczne i referencyjne, zastrze偶one znaki towarowe itp.), edycji s艂ownik贸w, etykietowania wybranych element贸w dokumentu, t艂umaczenia z dziurami (ang. gaps), pasowania rozmytego (ang. fuzzy matching). Funkcjonalno艣ci te przy艣pieszaj膮 prac臋 t艂umacza, minimalizuj膮c szans臋 zaistnienia pewnych klas b艂臋d贸w w procesie t艂umaczenia oraz u艂atwiaj膮 zarz膮dzanie dokumentem oraz baz膮 s艂ownik贸w. Tym samym, skr贸cony jest cykl produkcyjny dokumentu, co szczeg贸lnie jest wa偶ne przy dokumentach DTP, kt贸re wymagaj膮 r贸wnoleg艂ego t艂umaczenia na wiele j臋zyk贸w (katalogi, broszury reklamowe).We present and discuss a number of problems related to effective translation of product catalogues and advertising brochures with a CAT (Computer-Aided Translation) application. CAT tools usually work on smali text phrases (snippets) organized into so-called Translation Memories (TM). Those tools make it possible to navigate freely over the document, automatically translate recognized phrases and prompt suggestions for translating phrases similar to ones already found in the system, search and update the TMs, and more. The problems and issues we consider here can generally be divided into those related to the user interface and those based on text algorithms. In particular, we solved the problems of symbol detection (where "symbols" are sequences of characters which should not be translated, like numbers, abbreviations of physical units, product codes, reference numbers, registered symbols and trademarks etc), TM editing, document annotation, translating with gaps, fuzzy matching. Those functionalities speed up the work of a translator (e.g., by minimizing the probability of occurrence of some classes of errors in the translation process) and make the management and maintenance of the document and TMs easier. In this way, the document release cycle is shortened, which is of utmost importance for the DTP documents which require parallel translation into many languages (catalogues, advertising brochures)
    corecore